检索结果

Select

1. 多模态预训练模型综述

王惠茹, 李秀红, 李哲, 马春明, 任泽裕, 杨丹

《计算机应用》唯一官方网站 2023, 43 (4): 991-1004. DOI: 10.11772/j.issn.1001-9081.2022020296

摘要（1478）

HTML （131）

PDF （5539KB）（1170）

PDF（mobile）（3280KB）（91）

预训练模型（PTM）通过利用复杂的预训练目标和大量的模型参数，可以有效地获得无标记数据中的丰富知识。而在多模态中，PTM的发展还处于初期。根据具体模态的不同，将目前大多数的多模态PTM分为图像?文本PTM和视频?文本PTM；根据数据融合方式的不同，还可将多模态PTM分为单流模型和双流模型两类。首先，总结了常见的预训练任务和验证实验所使用的下游任务；接着，梳理了目前多模态预训练领域的常见模型，并用表格列出各个模型的下游任务以及模型的性能和实验数据比较；然后，介绍了M6（Multi-Modality to Multi-Modality Multitask Mega-transformer）模型、跨模态提示调优（CPT）模型、VideoBERT（Video Bidirectional Encoder Representations from Transformers）模型和AliceMind（Alibaba’s collection of encoder-decoders from Mind）模型在具体下游任务中的应用场景；最后，总结了多模态PTM相关工作面临的挑战以及未来可能的研究方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 事件抽取综述

马春明, 李秀红, 李哲, 王惠茹, 杨丹

《计算机应用》唯一官方网站 2022, 42 (10): 2975-2989. DOI: 10.11772/j.issn.1001-9081.2021081542

摘要（908）

HTML （139）

PDF （3054KB）（539）

将用户感兴趣的事件从非结构化信息中提取出来，然后以结构化的方式展示给用户，这就是事件抽取。事件抽取在信息收集、信息检索、文档合成、信息问答等方面有着广泛应用。从全局出发，事件抽取算法可以分为基于模式匹配的算法、触发词法、基于本体的算法以及前沿联合模型方法这四类。在研究过程中根据相关需求可使用不同评价方法和数据集，而不同的事件表示方法也与事件抽取研究有一定联系；以任务类型区分，元事件抽取和主题事件抽取是事件抽取的两大基本任务。其中，元事件抽取有基于模式匹配、基于机器学习和基于神经网络这三种方式，而主题事件抽取有基于事件框架和基于本体两种方式。事件抽取研究在中英等单语言上均已取得了优秀成果，而跨语言事件抽取依然面临着许多问题。最后，总结了事件抽取的相关工作并提出未来研究方向，以期为后续研究提供参考。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 基于Hessian正则化和非负约束的低秩表示子空间聚类算法

范莉莉, 卢桂馥, 唐肝翌, 杨丹

《计算机应用》唯一官方网站 2022, 42 (1): 115-122. DOI: 10.11772/j.issn.1001-9081.2021071181

摘要（241）

HTML （11）

PDF （661KB）（181）

针对低秩表示（LRR）子空间聚类算法没有考虑数据局部结构，在学习中可能会造成局部相似信息丢失的问题，提出了一种基于Hessian正则化和非负约束的低秩表示子空间聚类算法（LRR-HN），用来探索数据的全局结构和局部结构。首先，利用Hessian正则化良好的推测能力来保持数据的局部流形结构，使数据局部拓扑结构的表达能力更强；其次，考虑到获得的系数矩阵往往有正有负，而负值往往没有实际意义的特点，引入非负约束来保证模型解的有效性，使其在数据局部结构描述上更有意义；最后，通过最小化核范数寻求数据全局结构的低秩表示，从而更好地聚类高维数据。此外，利用自适应惩罚的线性交替方向法设计了一种求解LRR-HN的有效算法，并在一些真实数据集上，采用正确率（AC）和归一化互信息（NMI）对所提出的算法进行了评估。在ORL数据集上聚类数目为20时的实验中，LRR-HN与LRR算法相比，AC和NMI分别提高了11%和9.74%；与自适应低秩表示（ALRR）算法相比，AC和NMI分别提高了5%和1.05%。实验结果表明，LRR-HN与现有的一些算法相比，AC和NMI均有较大的提升，有较好的聚类性能。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. 基于光滑性和主成分的非负矩阵分解算法

马鹏杨丹方蔚涛葛永新张小洪

计算机应用 2012, 32 (05): 1362-1365.

摘要（1131）

PDF （2135KB）（664）

非负矩阵分解(NMF)存在收敛速度慢的缺点，其根本原因是基图像（基矩阵）包含大量的噪声点。另外，系数矩阵相关性很大，不利于区分不同图像。鉴于以上缺点，提出了基于光滑性和主成分的非负矩阵分解（SPNMF）：一方面通过添加常数矩阵来增强基矩阵的光滑性，平抑噪声点，达到减少迭代次数的目的；另一方面在原损失函数基础上，将系数矩阵不同列之间的方差作为惩罚项，提高系数矩阵的区分度。在PIE和FERET人脸库中的实验表明，SPNMF不仅能够提高人脸识别的正确率，而且速度比NMF快2~4倍，使得基于非负矩阵的人脸识别系统更具有实用价值。

参考文献 | 相关文章 | 多维度评价

Select

5. 基于混沌遗传算法的雷达/干扰机共享信号设计

杨丹丹刘以安唐霜天吴少鹏

计算机应用 2010, 30 (12): 3218-3221.

摘要（1449）

PDF （906KB）（1009）

雷达/干扰机共享信号的波形设计是电子战中实现雷达/干扰机作战系统能量共享的关键。针对共享信号的性能设计问题，提出了一种新型的混合混沌遗传优化算法。采用改进的tent混沌系统初始化种群，将混沌特性嵌入到自适应遗传算法的循环体中，分别设计分段混沌交叉算子和退化混沌变异算子，避免了搜索过程陷入局部极值的陷阱而快速收敛于全局最优解。通过实验证明，该方法能够较快地搜索到优化问题的最优解，验证了混沌遗传算法对雷达/干扰机共享信号优化问题的有效性。

相关文章 | 多维度评价

Select

6. 一种高精度的加权鲁棒估计算法

杨丹王宇琛张小洪

计算机应用

摘要（1241）

PDF （506KB）（684）

通过构造与余差有关的目标函数，给出了一种高精度估计图像几何变换矩阵的鲁棒算法——加权鲁棒估计算法。算法首先对原始数据进行计算得出图像间几何变换关系矩阵，再利用特征点周围的灰度信息进行权值计算。在拟合几何变换矩阵的迭代过程中，寻找目标函数最小的匹配关系，从而对两幅图像进行精确配准。实验结果证明，使用该技术后算法的图像配准效果较理想，鲁棒性好，真实感强，实际应用价值较高。

相关文章 | 多维度评价

Select

7. DDoS攻击的全局异常相关检测方法

李宗林胡光岷杨丹姚兴苗

计算机应用 2009, 29 (11): 2952-2956.

摘要（1562）

PDF （560KB）（1375）

骨干网中存在的DDoS攻击，由于背景流量巨大，且分布式指向受害者的多个攻击流尚未汇聚，因此难以进行有效的检测。为了解决该问题，提出一种基于全局流量异常相关分析的检测方法。根据攻击流引起流量之间相关性的变化，采用主成分分析提取多条流量中潜在异常部分之间的相关性，并将相关性变化程度作为攻击检测测度。实验结果证明了该测度的可用性，能够克服骨干网中DDoS攻击流幅值相对低且不易检测的困难，同现有的全局流量检测方法相比，所提出的方法能够取得更高的检测率。

相关文章 | 多维度评价

Select

8. 基于二元树复小波特征表示的人脸识别方法

黄中美张小洪杨丹

计算机应用

摘要（1915）

PDF （710KB）（957）

二元树复小波变换（DTCWT）具备近似平移不变、多方向选择、完全重构和高效计算等优点，适合于人脸特征提取。提出了一种新的基于二元树复小波变换的人脸特征表示方法，用二维DTCWT提取了人脸图像不同尺度、位置和方向的局部特征，并用多尺度多方向的信息生成DTCWT人脸特征图。实验证明了DTCWT人脸特征表示方法提取了最具可判别性的人脸特征，获取了高识别率和泛化能力，优于其他特征表示方法。

相关文章 | 多维度评价

Select

9. 基于二代小波和图像置乱的数字图像盲水印算法

雷明杨丹雷明罗建禄

计算机应用

摘要（1721）

PDF （995KB）（1457）

针对基于第一代小波的多分辨率水印算法运算速度慢、图像的重构质量与变换时延拓边界的方式有关等不足，根据第二代小波变换的特点，结合Amold置乱算法，给出一种基于小波多级提升和水印图像置乱来实现的改进型多分辨率图像水印算法，并分别采用Haar、Db2、Db4、9/7小波进行仿真实验。结果表明，该算法不仅保持了传统小波多分辨率图像水印算法的优点，而且有效提高了处理速度，并弥补了传统小波多分辨率图像水印算法中当滤波器增长时，含水印图像质量下降的不足。

相关文章 | 多维度评价

Select

10. 乐音识别方法及应用

徐国庆，杨丹，王彬洁，文俊浩

计算机应用 2005, 25 (04): 968-970. DOI: 10.3724/SP.J.1087.2005.0968

摘要（1140）

PDF （133KB）（1057）

通过研究乐音的声音和物理特性,提出一种识别乐音信号的方法,该方法实现在频域的精确定位,在基音频率检测上优于单一小波方法,在识别效果方面优于DTW方法,并开发了乐音识别和自动作曲系统。此方法可以为乐音识别提供参考。

相关文章 | 多维度评价